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Изложена методика нейросетевого моделирования сложных систем. Предложены эффективные алгоритмы решения задач от- 
дельных этапов, в частности модифицированный алгоритм «Ьох-соипііпд», развитие нейронной сети встречного распростране- 
ния. Изложение сопровождается результатами практического моделирования технологического процесса производства этиле- 
на на нефтехимическом предприятии. 


Современные объекты автоматизации - слож- 
ные многопараметрические нестационарные си- 
стемы, управление которыми требует разработки 
специфичных систем управления (СУ). Основа лю- 
бой СУ - модель объекта управления. 

Синтез модели сложной системы - многоэтап- 
ный процесс, включающий кроме собственно 
структурно-параметрической идентификации ряд 
других не менее важных этапов (сбор и предобра- 
ботка данных, тестирование, анализ синтезирован- 
ной модели и т. д.). От выбора конкретных методов, 
алгоритмов, применяемых на каждом этапе, цели- 
ком зависит результат моделирования, адекват- 
ность синтезированной модели реальному объек- 
ту/процессу. Спектр методов достаточно широк, от 
классического статистического анализа до аппара- 
та искусственных нейронных сетей (ИНС). Обла- 
сти применения различных методов могут частич- 
но или полностью перекрываться, можно с доста- 
точной уверенностью сказать, что нет этапа моде- 
лирования, для решения задач которого существу- 
ет единственно верный и оптимальный метод. Вы- 
бор существенным образом зависит от конкретно- 
го объекта и целей моделирования. 

Когда в качестве объекта моделирования высту- 
пает сложная система, и нет необходимости струк- 


турного соответствия (моделируется поведение), 
предпочтительнее оказывается нейросетевой под- 
ход. Широкий спектр решаемых задач, в том числе 
эффективное моделирование сложных нелинейных 
отображений, возможность обучения и заложенная 
в самой архитектуре адаптивность, перспективная 
аппаратная реализация, определяют выбор аппара- 
та нейронных сетей, как основного инструмента 
при синтезе моделей сложных систем [1-3]. 

Решение практически важных задач автомати- 
зации реальных сложных технологических процес- 
сов (ТП) требует разработки соответствующей ме- 
тодики нейросетевого моделирования. Существует 
базовый укрупненный алгоритм, определяющий 
общую последовательность шагов моделирования, 
на основании которого исследователь, в зависимо- 
сти от специфики объекта моделирования, соб- 
ственных предпочтений и практического опыта 
формирует свой «ритуал» анализа данных, опреде- 
ляет конкретные методики и алгоритмы, приме- 
няемые на каждом этапе моделирования. В самом 
общем виде схему анализа можно представить сле- 
дующим образом. 

Представленная разработанная на основании 
общей схемы методика была успешно апробирова- 
на при моделировании ТП производства этилена 
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на нефтехимическом предприятии [4]. Соответ- 
ствующий технологический процесс в упрощен- 
ном виде представлен на рис. 2. 



Рис. 1. Схема анализа данных 


Исходное сырье для ТП в виде прямогонного 
бензина поступает на печи пиролиза. Высокотем- 
пературный нагрев превращает прямогонный бен- 
зин в пирогаз (совокупность углеводородов). Пи- 
рогаз в свою очередь поступает на очистку и про- 
сушку, а затем газоразделение. Под большим давле- 
нием пирогаз сжимается и затем в ректификацион- 
ной колонне разделяется на фазы: этан-этилено- 
вую фракцию (ЭЭФ), пропан-пропиленовую, а 
также фракции более высокого порядка: бутилен- 
дивиниловую, бутилен-бутадиеновую и др. 
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Рис. 2. Упрощенная схема технологического процесса про- 
изводства этилена 

ЭЭФ затем поступает в реактор, проходит три 
зоны, где она взаимодействует с катализатором, ги- 
дрируется водородом и подвергается другим техно- 
логическим преобразованиям, на выходе получаем 
полезный продукт в виде сжиженного газа этилена, 
содержащего некоторое количество примесей, из 
которых наибольшее влияние на качество оказыва- 
ет ацетилен. Чем меньше ацетилена в готовом про- 
дукте, тем выше его качество. 

Технологический процесс производства этиле- 
на контролируется и управляется операторами в 
аппаратной. Основным средством контроля техно- 
логического процесса выступают хроматографы. 
Информация от хроматографов поступает на реги- 
страторы в аппаратной. Анализируя высоту пиков 
ацетилена химической смеси, сравнивая с кон- 
трольными значениями вещества, оператор на ос- 
нове информации от трех хроматографов, по одно- 
му на зону реактора, управляет основными техно- 
логическими параметрами производства. В общей 
сложности порядка 48 параметров включая объем 
исходного вещества (ЭЭФ), температуру, объем во- 
дорода, давление по зонам реактора. 


Процесс производства этилена непрерывен и 
строго регламентирован, к безопасности процесса 
предъявляются повышенные требования, проведе- 
ние активного эксперимента на действующем про- 
изводстве невозможно, что затрудняет сбор данных 
для построения модели технологического процес- 
са. Износ и старение оборудования реактора и эл- 
ементов контроля, изменение свойств компонен- 
тов технологического процесса приводит к дрейфу 
параметров ТП, система нестационарна. Из-за от- 
сутствия удобной модели, оперативное управление 
затруднено и сводится к ведению технологического 
процесса с некоторым запасом, что приводит к пе- 
рерасходу сырья и низкому качеству конечного 
продукта. 

Подготовка данных 

Специфика сложных систем (недостаток ап- 
риорной информации, нестационарность, зашу- 
мленность), использование модели в СУ, когда на 
первый план выходит поведенческий аспект, прог- 
ностические способности модели, и структурное 
подобие не важно, определяют тип синтезируемой 
модели - «черный ящик». Модель системы строит- 
ся в терминах соотношения между состояниями 
входов и выходов (входы соответствуют внешним 
воздействиям на изучаемую систему, выходы её ре- 
акциям на них). Необходимая информация может 
быть получена либо в результате проведения экспе- 
риментов с реальной системой, что зачастую со- 
пряжено с определенными трудностями или вооб- 
ще невозможно, либо в результате наблюдений 
(пассивного эксперимента) за реальной системой 
- наиболее распространенный на практике при 
анализе сложных систем вариант. 

Собранные в результате эксперимента данные, 
как правило, являются «сырыми», их необходимо 
обработать: отредактировать пропуски и аномаль- 
ные выбросы, устранить противоречия, подверг- 
нуть трансформации (ИНС работают только с чи- 
словыми данными), устранить незначащие факто- 
ры и т. д. Качество собранных данных, их полнота 
и достоверность во многом определяют модель. 
Этап подготовки данных включает очистку, тран- 
сформацию и понижение размерности исходных 
данных. 

Процедура очистки данных подразумевает ре- 
дактирование аномалий, восстановление пропу- 
щенных значений, фильтрацию и сглаживание, 
удаление дубликатов и противоречий. При этом 
используются алгоритмы классической статисти- 
ки, робастной фильтрации, спектрального и вей- 
влет анализа, аппарат ИНС [1]. 

Полученные в результате наблюдений за реаль- 
ной системой данные упорядочены во времени. К 
эффективным и достаточно простым методам 
предварительной очистки упорядоченных данных 
следует отнести кубические сплайны и преобразо- 
вание Фурье. 
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Аппарат ИНС - универсальный инструмент 
анализа данных, результаты его работы не привяза- 
ны к конкретным единицам измерения, нейронная 
сеть оперирует с числовыми данными, предста- 
вленными, как правило, в интервале [0; 1]. Интер- 
вал масштабирования связан с используемой функ- 
цией активации нейронов. В простейшем случае 
производят линейное масштабирование. Подход не 
применим, когда в данных присутствуют редкие 
выбросы. В этом случае при линейной нормировке 
основная масса значений сосредотачивается в не- 
большой области интервала масштабирования. 
Проблема решается заменой экстремальных значе- 
ний статистическими характеристиками данных 
(средним и дисперсией) и использованием нели- 
нейного преобразования. Процедура нормировки 
непосредственно влияет на процесс обучения ней- 
ронной сети (главным образом на скорость) и каче- 
ство обобщения синтезированной модели [1,5]. 

Для включения нечисловой информации про- 
изводится ее кодирование, руководствуясь прин- 
ципом максимизации энтропии. Выделяют два ос- 
новных типа нечисловых переменных: упорядо- 
ченные или ординальные и категориальные. Исхо- 
дя из принципа равномерного заполнения единич- 
ного интервала закодированными значениями для 
ординальных переменных используют деление в 
зависимости от числа примеров каждого класса, 
численное значение - центр соответствующего 
отрезка: А х=Р г /Р, где Р г - число примеров класса г, 
Р - общее число примеров. Для категориальных 
переменных применяют обычно двоичное или би- 
полярное кодирование, при этом учитывается по 
возможности равномерность загрузки каждого из 
полученных числовых значений. 

Любая реальная система взаимодействует со 
средой множеством способов. Строя модель систе- 
мы, из всего множества связей отбирают конечное 
их число и включают их в список входов и выходов. 
Сложность в том, что в действительности заранее 
не известно, какие входные параметры оказывают 
существенное влияние на выходные целевые пара- 
метры, а какие нет. Понижение размерности приз- 
накового пространства, устранение незначащих 
факторов - достаточно сложный и важный этап 
предобработки данных для нейросетевого анализа. 

Значимость параметра определяется силой его 
взаимосвязи с другими параметрами. Если сильна 
связь между двумя входными параметрами, то, ско- 
рее всего исключение одного из них не окажет су- 
щественного влияния на общую информативность 
выборки. Слабая связь между входным параметром 
(фактором) и выходом модели служит признаком 
низкой информативной способности данного фак- 
тора. Существует множество различных мер вза- 
имосвязи между переменными. Выбор определен- 
ной меры в конкретном исследовании зависит от 
числа переменных, используемых шкал измерения, 
природы зависимостей. Наиболее часто на практи- 
ке в качестве меры линейной зависимости двух пе- 


ременных используют коэффициент корреляции 
Пирсона. 

Наличие линейной связи между переменными 
позволяет сделать предположение о реально более 
низкой размерности признакового пространства. 
Один из наиболее простых и распространенных 
методов понижения размерности - анализ главных 
компонент (ГК), позволяющий в результате линей- 
ного преобразования вместо исходных признаков, 
получить набор независимых факторов. Один из 
недостатков метода главных компонент состоит в 
том, что это чисто линейный метод, он не учитыва- 
ет некоторые важные характеристики структуры 
данных, что ограничивает его применимость. 

Для более глубокой предобработки входов мож- 
но использовать все богатство алгоритмов самооб- 
учающихся нейросетей. В частности можно вос- 
пользоваться методом нелинейных главных компо- 
нент, который реализуется автоассоциативными 
нейронными сетями с узким горлом [1]. Это мно- 
гослойные сети прямого распространения, кото- 
рые обучают выдавать в качестве выходов свои соб- 
ственные входы, но при этом в промежуточном 
слое содержится меньше нейронов, чем во входном 
и выходном слоях. При использовании трехслой- 
ной сети с линейными функциями активации по- 
лучаем нейросетевой аналог метода главных ком- 
понент. 

Описанные методы позволяют представить ис- 
ходные входные данные в максимально информа- 
тивном виде, однако ни как не учитывают зависи- 
мость выходов от входов. В предположении о ли- 
нейной зависимости оценить значимость входов 
достаточно легко на основе анализа взаимной кор- 
реляции, но в этом случае применение нейронных 
сетей теряет всякую привлекательность, постро- 
ение линейной регрессионной модели - более про- 
стое и эффективное решение. Рекомендуется зара- 
нее освободиться от тривиальных линейных зави- 
симостей и использовать для нейроанализа только 
нелинейную составляющую данных. 

Определение информативности входных пере- 
менных на основе обученной нейронной сети - 
процедура спорная, и, безусловно, трудоемкая. 
Необходимость выбора конфигурации сети, ее об- 
учение, интерпретация полученных результатов за- 
нимают много времени. Требование адаптации мо- 
дели с привлечением новых эмпирических данных 
делает использование данного метода достаточно 
проблематичным . 

Один из методов редукции пространства вхо- 
дов, учитывающий влияние признаков на отклик и 
инвариантный к специфике зависимости - алго- 
ритм «Ьох-соипІіп§». В соответствии с алгоритмом, 
значимость входов определяется на основании 
оценки предсказуемости выходов, обеспечиваемой 
данным набором входных переменных. Чем выше 
предсказуемость - тем лучше соответствующий на- 
бор входов. 


102 




Технические науки 


Мерой предсказуемости случайной величины 
является ее энтропия. В методике «Ьох-соипІіп§» 
энтропия приближенно оценивается по числу за- 
полненных ячеек, на которые разбивается интер- 
вал ее возможных значений, качественно, энтро- 
пия есть логарифм эффективного числа заполнен- 
ных ячеек. 

Предсказуемость случайного вектора У, обеспе- 
чиваемая знанием другой случайной величины X, 
дается кросс-энтропией: І(У,Х)=Н(У)+Н(Х)~ 
-Н(Х,У)=Н(У)-Н(У\Х). Качественно, кросс-энтро- 
пия равна логарифму отношения типичного раз- 
броса значений переменной У к типичному разбро- 
су этой переменной, но при известном значении 

переменной X: І(У,Х) = 1о§— Чем больше 

кросс-энтропия, тем больше определенности вно- 
сит знание значения в предсказание значения пе- 
ременной У. 

Методика дает наиболее общий рецепт опреде- 
ления значимости входов, позволяя также оцени- 
вать степень предсказуемости выходов. Остается 
открытым вопрос о выборе оптимальной комбина- 
ции признаков. Полный перебор (2"-1) с расчетом 
кросс-энтропии в пространстве все более высокой 
размерности (по мере увеличения числа отобран- 
ных признаков) задача уже при небольшом числе 
переменных достаточно сложная. Для упорядочен- 
ного перебора возможных комбинаций предлагает- 
ся использовать генетический алгоритм, который 
гарантирует нахождение «хорошего» решения за 
приемлемое время. 

Контроль основных параметров и регулирова- 
ние ТП получения этилена производится в непре- 
рывном режиме, вся информация с периодично- 
стью в час заносится в соответствующие журналы. 
ТП определяется 48 доступными непосредственно- 
му измерению контролируемыми параметрами, все 
непрерывные величины. Основная задача - по- 
строение модели для определения (прогнозирова- 
ния) концентрации ацетилена на выходе реактора 
(оптимизация ТП сводится к минимизации приме- 
си ацетилена в конечном продукте) на основании 
известных значений других параметров, среди ко- 
торых объем вещества (ЭЭФ), температура, объем 
водорода, давление по зонам реактора (рис. 2). 

При моделировании использовалась выборка 
из 374 наблюдений, без дубликатов и противоречи- 
вых записей, ограниченность выборки определяет- 
ся актуальностью и качеством доступных на мо- 
мент проведения исследования данных. Оценка и 
фиксация значений основных параметров техноло- 
гического процесса производится вручную, что 
определяет достаточно высокую погрешность со- 
бранных данных и их «гладкость»: отсутствуют вы- 
бросы, пропуски, практически нет необходимости 
проводить дополнительную обработку и фильтра- 
цию. 


Решение задачи затруднено небольшим относи- 
тельно числа переменных, учитывая их непрерыв- 
ный характер и достаточно широкую область 
варьирования, объемом имеющихся данных. При 
этом на первый план выходит задача оценки ин- 
формативности входных параметров. В ходе реше- 
ния задачи для сравнения использовались данные, 
редуцированные методом главных компонент и 
модифицированным «Ьох-соипІіп§». Оценка про- 
водилась опосредованно по характеристикам син- 
тезированных на основании трех (исходная и полу- 
ченные в результате работы алгоритмов) выборок 
моделей. Сравнение кажется не совсем удачным, 
методы используют разные подходы, если в первом 
случае в результирующем наборе факторов обычно 
присутствуют все исходные переменные в виде ли- 
нейных комбинаций, то во втором из выборки не- 
посредственно удаляются те переменные, влияние 
которых на выход признается незначимым. Однако 
в данном исследовании важна, прежде всего, прак- 
тическая сторона вопроса, результат - адекват- 
ность синтезированной модели, к тому же сравне- 
ние позволяет сделать некоторые интересные вы- 
воды. 

Методом главных компонент на основе исход- 
ных 47 параметров были выделены 20 факторов, 
которые описывают 95 % общей дисперсии в 
имеющихся данных. 

Для модифицированного «Ъох-соипіпщ» алго- 
ритма входные переменные определяем позицион- 
но в виде бинарной последовательности (для удоб- 
ства использования ГА), где 1 означает, что данный 
признак используется. При этом хромосома коди- 
руется соответственно последовательностью из 47 
бит. Каждая особь в популяции обладает мерой 
приспособленности к окружающей среде. В дан- 
ном случае мера приспособленности определяется 
кросс-энтропией, подсчитанной на данном наборе 
признаков и скорректированной на количество пе- 
ременных (необходимо найти минимальный набор 
переменных, обладающий максимальной инфор- 
мативностью). Чем больше определенности вносит 
сочетание признаков в предсказание значения от- 
клика, тем особь лучше приспособлена и тем выше 
шансы на выживание. 

По нескольким запускам ГА был определен оп- 
тимальный набор параметров - 26 переменных. 
Характерно, что попытка сокращения простран- 
ства факторов, сформированного методом ГК, не 
увенчалась успехом, максимальной информатив- 
ностью обладает набор из всех 20 факторов. 

Синтезированные нейросетевые модели, по- 
строенные на исходном и редуцированных наборах 
признаков, близки по основным показателям, нес- 
колько выделяется в лучшую сторону модель на 
выборке, обработанной методом главных компо- 
нент. 

В наборе переменных, полученном с помощью 
алгоритма «Ьох-сошгйп§» отсутствуют параметры 
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ТП, однозначно причисляемые экспертами (техно- 
логами производства) к значимым. Что позволяет 
говорить о недостаточной презентативности имею- 
щейся выборки, значимые переменные были от- 
брошены на основании их слабого вклада в опреде- 
лении величины отклика на исследуемом наборе 
данных. Важно не забывать о том, что информатив- 
ность переменных при моделировании сложных 
систем в условиях недостатка априорной информа- 
ции мы может оценить только по имеющейся вы- 
борке. Низкое качество выборки влечет постро- 
ение модели, возможно достаточно точно описы- 
вающей данные, используемые при ее построении, 
однако неадекватной самой моделируемой систе- 
ме, что показывает необходимость последующей 
адаптации. 

Синтез модели 

Этапы структурного и параметрического синте- 
за нейросетевой модели тесно связаны. Следует от- 
метить, что применительно к нейросетевому моде- 
лированию сами понятия структурного и параме- 
трического синтеза несколько отличаются от того, 
что подразумевается под ними в эмпирико-стати- 
стических методах. Нейронная сеть уже модель. 
Выбирая топологию сети, количество слоев, ней- 
ронов в слое, связи между нейронами, функцию 
состояния и функцию активации конкретного ней- 
рона, мы определяемся с видом нейросетевой мо- 
дели, синтезируем структуру. От вида модели зави- 
сит выбор метода обучения ИНС, обучение - суть 
параметрической идентификации, при этом в ходе 
обучения изменяются веса, могут обнуляться меж- 
нейронные связи, варьироваться параметры функ- 
ций активации нейронов, что отображается и на 
структуре модели. 

Для целей моделирования главным образом ис- 
пользуют полносвязные многослойные нейронные 
сети с прямым распространением сигнала и нели- 
нейной функцией активации нейронов скрытых 
слоев - многослойные персептроны (МСП). 

Трехслойная полносвязная сеть, содержащая в 
скрытом слое радиально-симметричные нейроны - 
сеть радиально-базисных функций (РБФ-сеть) по 
своим возможностям близка МСП, а в чем-то даже 
превосходит [3]. Моделирование произвольной не- 
линейной функции с помощью всего одного проме- 
жуточного слоя избавляет от необходимости решать 
вопрос о числе слоев. Для обучения используется 
относительно простой, без рекурсии, алгоритм на- 
стройки, за счет чего РБФ-сеть обучается очень бы- 
стро (на порядок быстрее МСП). Сеть прекрасно 
справляется с задачей интерполяции. Однако РБФ- 
сети более чувствительны к «проклятию размерно- 
сти» и испытывают значительные трудности, когда 
число входов велико. Для аппроксимации одной и 
той же зависимости сети радиально-базисных 
функций требуется, как правило, больше элементов 
скрытого слоя в сравнении с МСП. РБФ-сети со- 
вершенно не приспособлены экстраполировать 


свои выводы за область предъявленных при обуче- 
нии данных. Перечисленные недостатки сужают 
область применения сетей с радиальными элемен- 
тами скрытого слоя, и, в частности, затрудняют их 
использование при моделировании сложных си- 
стем. Эти же недостатки свойственны обобщенно- 
регрессионным нейронным сетям. 

Сеть встречного распространения отлична от 
МСП и РБФ-сети гибридной структурой и наличи- 
ем слоя распознавания, при этом данная архитек- 
тура традиционно для целей моделирования непо- 
средственно используется редко, выполняя, как 
правило, вспомогательные функции. В сети 
встречного распространения объединены два хоро- 
шо известных алгоритма: самоорганизующаяся 
карта Кохонена и звезда Гроссберга. Их объедине- 
ние ведет к свойствам, которых нет ни у одного из 
них в отдельности. 

Нейроны входного слоя сети встречного рас- 
пространения служат лишь точками разветвления 
и не выполняют вычислений. Каждый нейрон 
входного слоя соединен с каждым нейроном слоя 
Кохонена (карта Кохонена). Аналогично, каждый 
нейрон в слое Кохонена соединен с каждым нейро- 
ном в слое Гроссберга. Карта Кохонена классифи- 
цирует входные векторы в группы схожих. Это до- 
стигается с помощью такой подстройки весов, при 
которой близкие входные векторы активируют 
один и тот же нейрон Кохонена. Задачей слоя Грос- 
сберга является получение требуемых выходов. 

Слой Кохонена обычно функционирует в духе 
«победитель забирает все», т. е. для данного вход- 
ного вектора один и только один нейрон Кохонена 
выдает на выходе логическую единицу, все осталь- 
ные выдают ноль. В этом случае каждый нейрон 
слоя Гроссберга лишь выдает величину веса, кото- 
рый связывает этот нейрон с единственным нену- 
левым нейроном Кохонена. 

Сеть встречного распространения дает кусочно- 
постоянное представление модели У=Р(Х), по- 
скольку при вариации вектора X в пределах одного 
кластера на слое соревнующихся нейронов Кохо- 
нена возбуждается один и тот же нейрон-победи- 
тель. В случае сильно зашумленных данных, такое 
представление обладает хорошими регуляризирую- 
щими свойствами. При этом процедура обучения 
сети встречного распространения заметно быстрее, 
чем, например, обучение МСП, это определяет 
применение сети для быстрого моделирования си- 
стем, где большая точность МСП вынуждает отдать 
ему предпочтение в окончательном варианте, но 
важна быстрая начальная аппроксимация. 

Особую ценность сеть встречного распростра- 
нения представляет для оценки корректности по- 
становки задачи моделирования [2]. Широким 
классом некорректно поставленных задач являют- 
ся так называемые обратные задачи. При постанов- 
ке задачи предсказания реакции исследуемой си- 
стемы при ее известном состоянии на заданные 
внешние воздействия, т. е. получения величин У 
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при заданных ^исследователь имеет дело с прямой 
задачей моделирования. Целью обратной задачи 
выступает получение входных величин X, соответ- 
ствующих наблюдаемым значениям выходов У. 
При моделировании сложных систем соответ- 
ствующий запрос к модели формулируется, как по- 
иск внешних условий, которые привели к реализо- 
вавшемуся отклику системы. Для большинства 
приложений чисто обратные задачи встречаются 
относительно редко, обычно имеются дополни- 
тельные сведения о системе. Например, кроме из- 
меренного отклика, могут быть известны перемен- 
ные состояния системы и часть параметров воздей- 
ствия. В этом случае задача относится к классу 
комбинированных: по известным значениям части 
компонент входного Хи выходного У векторов вос- 
становить неизвестные компоненты. 

Обратные и комбинированные задачи зачастую 
являются некорректно поставленными, нарушая 
единственность существующего решения. Прямая 
задача также может быть некорректной, что явля- 
ется признаком неполноты данных (не все призна- 
ки учтены) или следствием сильной зашумленно- 
сти. 

Классическим методом решения некорректных 
задач является метод регуляризации. Суть метода 
состоит в использовании дополнительных априор- 
ных предположений о характере решения. Обычно 
в качестве таковых используются требования мак- 
симальной гладкости функции, представляющей 
решение задачи, в случае нейросетевого моделиро- 
вания регуляризирующие методы сводятся к опти- 
мизации функционала ошибки с аддитивной до- 
бавкой, исчезающей по мере улучшения гладкости 
функции. На практике регуляризация сводится к 
ограничению структурной сложности нейросете - 
вой модели, так как при неограниченном увеличе- 
нии числа нейронов скрытых слоев сеть способна 
достаточно точно запомнить произвольный об- 
учающий набор, при этом вместо гладкой будет по- 
лучена «пилообразная» функция, проходящая че- 
рез все обучающие точки. 

В общем случае задача может иметь корректное 
(единственное и устойчивое решение) решение для 
некоторых областей множества значений и являть- 
ся некорректно поставленной для других. Оценка 
некорректности постановки задачи моделирования 
(выделения областей некорректности) с помощью 
сети встречного распространения может быть осу- 
ществлена следующим образом: 

1) Строится распределение векторов обучающей 
выборки по кластерам, содержащим близкие по 
величине параметры наблюдения (карта Кохо- 
нена). 

2) На каждый кластер строится и обучается своя 
нейронная сеть, оценивается ошибка обучения 
(обобщения), которая является характеристи- 
кой степени некорректности отображения в 
области данного кластера. 


3) Выбирается некоторое пороговое значение 
ошибки, на основании сравнения с которой по 
каждому кластеру выносится решение о некор- 
ректности решения задачи на подмножестве 
значений кластера. 

Предварительная кластеризация данных и раз- 
дельное решение задачи аппроксимации на полу- 
ченных кластерах позволяет решить проблему вы- 
деления областей некорректности и повысить точ- 
ность модели за счет потенциальной возможности 
достижения меньшей ошибки обучения (обобще- 
ния) для отдельного кластера. 

Архитектура на основе сети встречного распро- 
странения позволяет автоматизировать процесс 
синтеза модели сложной системы и его корректи- 
ровку при поступлении новой информации. На 
слой Кохонена поступает входной вектор, решается 
задача соотнесения информации с известными пре- 
цедентами в прошлом - задача распознавания си- 
туации, вектор либо принадлежит существующему 
кластеру, либо под него формируется новый. При- 
надлежность кластеру определяет обученную ней- 
ронную сеть (условимся, что второй слой вместо од- 
ного нейрона — звезды Гроссберга на каждый ней- 
рон Кохонена содержит отдельную нейронную сеть 

- МСП), которая отрабатывает полученную инфор- 
мацию, формирование нового кластера определяет 
синтез новой нейронной сети, ее обучение. 

Использование предложенной архитектуры при 
моделировании ТП получения этилена на имею- 
щихся данных дало два кластера (10 и 90 % выбор- 
ки соответственно), при этом синтезировать МСП 

- решатель с приемлемой ошибкой удалось только 
на втором. Низкая представительность выборки не 
позволяет сделать обоснованные выводы относи- 
тельно характеристик данных первого кластера. 

Верификация модели 

Использование ошибки обобщения, как крите- 
рия качества при выборе оптимальной структуры 
нейросетевой модели и ее обучении, применение 
регуляризирующих критериев, способствующих 
поддержке баланса между сложностью и ошибкой 
модели, не позволяют в полной мере гарантировать 
качество модели, ее пригодность для решения за- 
дач исследования. Необходима верификация - за- 
вершающий этап разработки модели. 

Прежде всего, следует оценить адекватность 
модели. Под адекватностью понимают степень со- 
ответствия модели реальному объекту, для описа- 
ния которого она строится. Учитывая, что модель 
ориентирована, как правило, на исследование 
определенного подмножества свойств этого объек- 
та, не объекта целиком, можно считать, что аде- 
кватность модели определяется степенью ее соот- 
ветствия целям исследования. Построение модели 
сложного объекта управления преследует цель вос- 
произведения внешнего функционирования, ими- 
тации поведения исследуемой системы. Распро- 
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страненным способом подтверждения адекватно- 
сти синтезированной модели является проверка 
соответствующей гипотезы на основе статистиче- 
ских критериев. Процедура оценки основана на 
сравнении измерений на реальной системе и ре- 
зультатов экспериментов на модели и может про- 
водиться различными способами. 

Следующий важный шаг - оценка устойчиво- 
сти модели. При оценке адекватности модели ис- 
пользуется ограниченное подмножество всех воз- 
можных значений входных параметров. В связи с 
этим для обоснования достоверности получаемых 
результатов моделирования большое значение 
имеет проверка устойчивости модели - ее способ- 
ность сохранять адекватность на всем возможном 
диапазоне входных параметров, а также при внесе- 
нии изменений в конфигурацию системы. Универ- 
сальной процедуры проверки устойчивости модели 
не существует. В каждом конкретном случае иссле- 
дователь вынужден прибегать к специфичным ме- 
тодам и руководствоваться здравым смыслом. 

Очевидно, что устойчивость является положи- 
тельным свойством модели, однако если измене- 
ние входных воздействий или параметров модели 
(в некотором заданном диапазоне) не отражается 
на значениях выходных параметров, то польза от 
такой модели невелика. В связи с этим возникает 
задача оценивания чувствительности модели к из- 
менению параметров входных сигналов и внутрен- 
них параметров самой системы. Такую оценку про- 
водят по каждому параметру в отдельности. 

Оценить чувствительность модели к изменению 
внутренних параметров, в случае ИНС речь идет, 
прежде всего, о весовых коэффициентах межней- 
ронных соединений, можно, используя функцио- 
нал качества, в простейшем случае - функцию 
ошибки сети. Хорошая нейросетевая модель обыч- 
но имеет по каждому параметру относительный ко- 
ридор стабильности, в пределах которого функ- 
ционал качества изменяется незначительно в силу 
распределения вычислительных функций между 
нейронами сети. 
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Использование в качестве переменных (допол- 
нительных к наборам независимых и зависимых 
переменных самой задачи) внутренних сигналов 
нейронной сети позволяет детально анализировать 
выстроенную ИНС при обучении и целенапра- 
вленно ликвидировать узкие места, получать нуж- 
ные свойства решения [5]. 

Таким образом, при оценке качества нейросете - 
вой модели могут быть использованы как методы, 
разработанные в рамках статистического подхода, 
так и специфичные для ИНС методы; их совме- 
стное применение позволяет провести анализ наи- 
более полно. 

Для модели ТП производства этилена процеду- 
ра верификации производится при поступлении 
новой информации и заключается в сравнении 
ошибки сети с фиксированным малым значением, 
превышение определяет необходимость подстрой- 
ки параметров сети. Если данные существенно раз- 
личаются с используемыми при синтезе начальной 
модели - формируется новый кластер и нейронная 
сеть. 

Предлагаемая методика не позволяет полно- 
стью автоматизировать синтез нейросетевой моде- 
ли, начиная от этапа сбора и предобработки дан- 
ных и до принятия решения об адекватности моде- 
ли. Моделирование на основе модифицированной 
сети встречного распространения ставит задачи, 
решение которых сегодня требует привлечения ин- 
теллектуальных способностей человека: выбор чув- 
ствительности слоя Кохонена, структуры сетей - 
решателей. Частично решению указанных проблем 
может способствовать применение эволюционных 
алгоритмов для структурного и параметрического 
синтеза нейросетевых моделей. 

Следование описанной общей методике, при- 
менение эффективных универсальных методов 
нейросетевого моделирования и эволюционных 
алгоритмов позволяет облегчить процедуру синтеза 
модели сложной системы за счет четкого определе- 
ния последовательности шагов и сужения области 
выбора применяемых на каждом шаге алгоритмов. 
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